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摘要 本 文 详细 地 梳理 了 人 类 语音 起 源 和 演化 的 研究 成 果 ， 为 对 语音 起 源 和 演化 感 兴趣 的 学 者 
和 研究 生 提 供 了 大 量 有 关 的 研究 文献 ， 并 对 前 人 在 这 个 领域 里 的 研究 进行 了 初步 的 评述 。 
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1. 引 言 战 〈[3]Fitcn，2000) 。 这 些 新 的 证 据 和 争 
语言 在 人 类 的 演化 过 程 中 起 着 重要 的 论 主 要 集中 在 : 1) 哺乳 动物 和 非 人 类 灵 


类 喉头 的 下 隆 是 否 能 产生 人 类 的 详 音 
作用 ， 如 何 找到 证 据 来 揭示 语言 的 起 源 是 。 长 类 喉头 的 下 降 是 从 能 ” 生 人 类 的 证 训 
` u Ny GE » KIKKE Lou M BLZ E Z [2 9 


WEERWHUUITUE TSR v amp, ERT PET ENER AR 
它 整合 了 古人 类 学 、 解 剖 学 、 语 音 学 、 言 。 出 具有 共振 峰 对 立 模式 的 声音 ? [5JBos 
语 科学 、 认 知 科学 等 相关 科学 。 在 语言 演 a 2017). 3) 在 研究 方法 上 ， 利 用 声 
化 的 研究 中 ， 言 语 发 音 的 研究 最 具有 可 行 。 省 模型 模拟 元 音 的 演化 和 涌现 是 否 有 效 ? 


Tun hess 4) 怎样 界定 元 音 的 涌现 和 涌现 的 时 间 ? 
性 ， 天 | E Ib v7 s EB SA y o A 、 a : is 
NOE CULAR, Taner, Boe 等 学 者 对 这 些 争论 、 新 的 观点 和 研究 
的 喉头 下 降 理论 (LDT) 。Lieberman 首先 方法 做 了 很 好 的 评论 〈[G]Bog et al , 


Š PE 2019) 。 下 面 我 们 将 对 人 类 语音 的 起 源 和 
EA EX 究 Fi B Ji , > es 
CEPR aL DA EAI ERRESA. 
语言 能 力 、 人 类 言语 演化 的 化 石 记 录 和 喉 2. 喉头 下 降 理论 
A 言语 的 神经 机 制 等 方面 、 : zs 
VON AN EH E 上 个 世纪 50 Ef, Lieberman 就 开始 
S Rc ds gut pea ioa, 利用 新 的 技术 和 概念 研究 非 人 类 灵 长 类 的 
LE v 十 , , 之 音 ， EL 3c — Tr Z2 Api ds > —, 
[2]Lieberman et 31,2015) > Lieberman 的 喉 i pu p aie piis ima 
头 下 降 理 论 在 学 界 几乎 主导 了 半 个 世纪 。 a lu m 
^W. TELE, eremum ATED ATR. MEEN 
累 和 观点 的 提出 ， 喉 头 下 降 理论 受到 了 挑 ”大 猩猩 的 叫 声 ， 并 很 据 声 学 分 析 的 结果 研 


究 了 声 道 解剖 和 声学 特征 之 间 的 关系 。 认 
为 它们 的 发 音 主 要 是 类 似 央 元 音 的 声音 ， 
暗示 了 非 人 类 灵 长 类 在 叫喊 时 没有 能 力 改 
变 喉 上 声 道 的 形状 〈[I7]Lieberman , 
1968) 。 由 于 猕猴 和 猿 类 咽 腔 很 小 ， 它 们 
不 能 发 出 人 类 的 语音 ， 因 为 这 是 本 质 的 生 
理 制 约 ， 所 以 无 法 产生 连续 变化 的 语言 所 
需 的 声 道 面积 ([8]Lieberman et al, 1969) . 
Lieberman 还 研究 了 出 生 婴 儿 的 句 声 ， 发 
现 人 类 婴儿 同 其 他 非 人 类 灵 长 动物 一 样 ， 
除了 喉头 整体 运动 ， 在 说 话 时 不 会 使 用 只 
上 声 道 。 由 于 受到 发 音 器 官 的 限制 ， 他 们 
也 缺少 咽 腔 面积 的 变化 〈[9]Lieberman et 
al,1971) o Lieberman 和 Crelin 还 利用 化 石 
模型 来 推 新 尼 安 德 特 人 声 道 的 解剖 结构 和 
声 道 形 状 ， 用 于 估算 尼 安 德 特 人 的 发 音 洪 
力 ， 最 终 将 这 种 发 音 潜力 与 人 类 的 语音 进 
行 了 对 比 研 究 ([10]Lieberman et al, 1971) 。 
Lieberman 的 研究 表明 , 声 道 的 功能 不 只 是 
为 了 呼吸 和 吞咽 ， 因 为 人 类 演化 的 骨骼 证 
据 显 示 出 了 一 系列 的 变化 ， 这 些 变 化 可 能 
是 灵 长 类 动物 的 声 道 在 某 种 程度 上 为 了 能 
够 说 话 而 形成 的 。 因 此 ， 应 被 视 为 人 类 的 
语音 输出 机 制 的 一 部 分 ， 即 人 类 特有 的 语 
言 能 力 。 
另 一 项 对 声 道 演化 的 重要 研究 是 从 古 
人 类 化 石 的 角度 。 黑 猩猩 和 现代 人 类 的 分 
化 可 以 追溯 到 大 约 6 百 万 年 前 
({11]Vallender Eric, et al. 2008.) ， 由 于 获 
取 化 石 资料 十 分 困难 ， 因 此 ， 从 古人 类 的 
化 石 研 究 声 道 的 演化 受到 了 制约 。 从 目前 
世界 主要 的 古人 类 化 石 看 ， 同 时 具有 头颅 
(cranium, skull))、 上 颌 (upper mandible), E 
Wi(upper teeth)、 下 颌 (lower mandible), F 
Wi (lower teetb) 的 化 石 只 有 十 几 种 ， 分 别 是 : 
Pataud 1, Combe-Capelle、Dolni Vestonice 
XV and XVI. Barma Grande 5, a Ferrassie 
1. Le Moustier、 Pech De L’aze. Roc de 
Marsal. Fish Hoek. Nariokotome, Amud, 
Jebei Qafzeh 9, Jebei Qafzehll. Shanidar 1, 
Skhul V ~、 Tabun I Teshik-Tash 、 
Zhoukoudian Upper Cave: Cast of PA.101. 
但 古人 类 完整 头颅 的 化 石 相对 较 多 ， 目 前 


= 


KA Ju + Ft ( [12 Jeffrey et al, 2002; 
[13]Jeffrey et al,, 2003) 。 由 于 口腔 中 的 肌 
肉 和 喉头 的 软骨 不 会 形成 化 石 ， 这 为 重 构 
声 道 的 研究 带 来 了 困难 。 


在 利用 化 石 对 人 类 声 道 演 化 的 研究 中 ， 
研究 人 员 首 先 测量 比较 了 现代 人 类 婴儿 和 
成 人 喉头 下 降 的 发 展 过 程 〈[14] Laitman et 
al, 1976) ， 同 时 测量 研究 了 灵 长 类 动物 
头颅 化 石和 人 属 头颅 化 石 的 颅 基线 上 的 牙 
槽 中 点 CA, prosthion) 、 口 后 点 CB, 
staphylion) ~ HERE. CC, hormion) . W 
'H 5i CD, sphenobasion ) 和 颅 底 点 CE, 
endobasion) 。 研 究 发 现 : 咽 上 收缩 肌 向 
前 和 向 下 几乎 垂直 于 枕骨 平面 的 定义 线条 
DE， 并 比较 研究 了 人 属 灵 长 类 和 非 人 属 灵 
长 类 颅骨 上 六 点 的 距离 ， 讨 论 了 这 些 距 离 
和 喉头 下 降 的 关系 ，([15] Laitman et al, 
1978 ; [16] Laitman et al, 1979; [17] 
Laitman et al, 1982) 。 根 据 以 上 的 这 些 对 
化 石 的 研究 ，Budil 发 展 出 了 一 种 计算 这 些 
参数 的 方法 ， 提 出 了 K 参数 ， 并 对 南 猿 、 
尼 安 德 特 人 和 知人 的 头颅 参数 进行 了 K S 
数 计算 ， 并 在 此 基础 上 对 人 属 的 声 道 进 行 
了 功能 重 构 〈[18] Budil，1994) 。 


Liberman 等 对 黑猩猩 、 现 代 人 类 婴儿 
及 成 人 发 首 器 官 生 理 形态 和 发 育 过 程 的 研 
究 以 及 Laitman 等 对 人 属 化 石 的 研究 ， 都 
对 Lieberman 的 喉头 下 降 理论 (LDT) 提 
供 了 证 据 。 在 这 一 理论 框架 下 ， 人 们 对 黑 
猩猩 到 现代 人 类 的 声 道 演 化 进行 了 大 量 研 
究 ， 并 对 古人 类 声 道 进行 了 重 构 ， 认 为 只 
头 下 降 是 人 类 声 道 演化 和 产生 语音 最 重要 
的 演化 途径 C[I] Lieberman, 1984; [2] 
Lieberman et al, 2015) 。 基 于 声学 和 解剖 
观察 的 坚实 基础 ,Lieberman 的 结论 被 认为 
是 事实 ,是 这 一 研究 领域 的 试金石 ,最 终 被 
称 为 喉头 下 降 理论 LDT)。 


3. 非 人 类 灵 长 类 和 哺乳 动物 喉头 的 下 降 


对 哺乳 动物 喉头 的 研究 发 现 ， 有 些 哺 
乳 动 物 的 喉头 也 会 下 降 ， 如 鹿 (4 Fitch et 
al, 2001) 、 蒙 古 羚羊 〈[19] Frey et al, 


2003; ) . BW. Seve. eR. JA 
ZO C[20] Weissengruber et al, 2002) 、 
黑猩猩 C[21] Nishimura et al, 2003; [22] 
Nishimura, 2005 ) R K X ( [23] 


2016) 。Boé fth HY JE ELSE A (Papio 
Papio) fi WF 252€ B], BE A AARE 
类 似 人 类 共振 峰 结 构 的 元 音 《〈[$] Boé et al 
2017). Pisanski 和 他 的 同事 认为 这 可 能 是 


Nishimura，2003) 。 并 对 非 人 类 灵 长 类 发 


早期 声音 控制 能 力 的 活 的 遗留 物 ， 这 种 能 


音 的 连续 性 和 不 连续 性 进行 了 研究 C[24] 
Berthommier,et al,2018) > Fitch 发 现 并 记 
录 了 哺乳 动物 山羊 、 狗 、 猪 和 绢 毛 猴 的 低 
喉头 、 舌 骨 和 舌头 更 广泛 的 动态 和 临时 的 
过 程 ， 认 为 喉头 下 降 不 是 人 类 独 有 的 ， 
BW T 喉头 下 降 是 两 条 演化 的 不 同 路 径 


力 导致 了 人 类 语言 的 清晰 表达 ([31]Pisanski 
et al,2016)。Fitch BJ A Be A Er UH TAE 
还 没有 演化 出 能 够 产生 语言 的 神经 系统 ， 

认为 人 类 语言 能 力 的 进化 需要 的 是 神经 系 
统 的 变化 ， 而 不 是 声音 结构 的 改变 〈[30] 
Fitch et al, 2016) 。 基 于 对 非 人 类 灵 长 类 


([3] Fitch, 2000) 。 他 们 认为 喉头 下 降 是 
为 了 延长 声 道 ， 通 过 降低 声 道 的 共鸣 频率 
让 人 感知 到 被 夸大 的 体型 ， 因 此 ， 体 型 夸 
大 提供 了 一 个 非 语言 学 的 替代 假设 ([25] 
Fitch, 1997)。 他 认为 像 所 有 哺乳 动物 一 样 ， 
最 早 的 人 科 动 物 在 发 音 时 重新 配置 发 音 解 
判 结构 就 可 以 获得 足以 产生 任何 清晰 易 履 
音素 的 声 道 结 构 。 但 可 以 看 出 非 人 类 动物 
喉头 下 降 所 形成 的 声 道 形态 与 人 类 的 声 道 
形态 还 是 有 很 大 的 差异 。 
4. 非 人 类 灵 长 类 的 发 音 

通常 认为 灵 长 类 动物 中 只 有 人 类 的 发 
音 器 官 具有 语言 发 首 能 力 ， 并 默认 包括 非 
人 类 灵 长 类 动物 在 内 的 哺乳 动物 的 声 道 在 
发 声 时 类 似 于 一 个 均匀 统一 的 uniform) 
或 张 开 的 管道 ([7] Lieberman,1968; [8] 
Lieberman et al, 1969; [26] Shipley et al, 
1991)。 但 近期 的 研究 表明 非 人 类 灵 长 类 也 
有 可 能 发 出 不 同 的 元 音 。 对 南非 狮 狮 的 发 
音 研 究 表明 ， 狮 狮 的 声 道 不 是 均匀 的 〈[27] 
Owren et a 1997)。Riede 等 人 首先 测试 了 
Diana monkey 的 报警 叫 声 与 管道 特性 的 一 
致 性 ， 他 们 的 研究 结果 表明 Diana monkey 
对 认 和 豹子 (baoleopard) 的 报警 叫 声 并 
不 像 schwa， 而 是 类 似 于 10 至 12 岁 儿童 /a/ 
的 发 音 ([28] Riede et al,2005)。 研 究 结 果 与 
VTL 相似 的 儿童 发 出 的 人 类 元 音 相 关 [29] 
Lee,1999) 。Fitch 等 人 研究 了 猕猴 有 可 能 
发 出 的 元 音 ， 认 为 猕猴 的 声 道 可 以 很 容易 
地 产生 足够 的 语音 范围 来 支持 口语 ， 是 可 
以 发 出 人 类 的 语音 的 〈[30] Fitch et al, 


声 道 解剖 和 发 音 的 研究 ， 有 一 些 学 者 认同 
“神经 假说 ”， 认 为 非 人 类 灵 长 类 的 发 音 器 
官 在 发 元 音 上 没有 问题 ， 问 题 是 它们 缺乏 
相应 的 脑 神经 机 制 〈[32]Boer ，2010; 
[33]Boer et al, 2010; [34] Kelly, 2016) 。 但 
Lieberman (AN, Fitch 等 人 研究 中 的 言语 
应 该 是 猕猴 的 言语 发 音 ， 并 不 能 将 这 个 言 
语 看 成 是 完全 意义 上 的 人 类 言语 
([35]Lieberman, 2017) 。 
5. 声 道 模 型 研究 

有 些 学 者 认为 生物 学 家 在 试图 将 语言 
研究 的 原则 和 方法 应 用 于 动物 交流 时 过 到 
了 困难 C[30] Fitch et al,2016) ， 根 据 不 同 
声 道 模 型 和 言语 产生 研究 的 新 成 果 ， 人 们 


对 声 道 和 言语 产生 的 关系 有 了 更 多 的 认识 。 


在 Lindblom 和 Harshman 等 人 研究 的 基础 
上 ([36]Lindblom et al, 1971; [37]Harshman 
et al, 1977), Maeda 的 模型 提高 了 发 音声 道 
使 用 主 成 分 分 析 建 模 的 矢 状 变量 ，Maeda 
] 7 个 控制 参数 可 以 解释 7096-9090 85) 75 26 
变化 〈[38]Maeda，1990) 。 利 用 这 一 模型 
和 肌 电 信号 ， 人 们 研究 了 声 道 模型 控制 参 
数 和 舌头 肌肉 的 活动 C[39]Maeda et 
al,1994; [40] Honda, 1996) 以 及 生理 机 制 

([41]Buchaillard et al,2009) 。Goldstein 将 
大 量 的 解剖 学 数据 整合 到 一 个 清晰 的 声 道 
生长 模型 中 ([42]Goldstein,1980)， 模 型 采 
了 水 平声 道 长 度 、 垂 直 声 道 长 度 和 声 道 
中 线 长 度 三 个 参数 Goldstein 在 
Mermelstein 成 人 模型 的 基础 上 
([43]Mermelstein，1973)， 利 用 她 的 数据 集 


, 


建立 了 声 道 矢 状 面 生 长 模型 。 给 出 了 声 道 
的 面积 函数 和 以 此 产生 的 共振 峰值 模拟 研 
究 新 生 儿 的 发 音 ， 认 为 新 生 儿 能 发 出 元 音 
lil; lal Jule Bo& 的 实验 室 开 发 了 可 变 线性 
关节 模型 (VLAM) 来 模拟 声 道 从 出 生 到 成 
年 的 生长 过 程 ([44]Bogs et al，1997)， 声 道 
长 度 的 生长 模式 引入 了 前 口腔 和 后 咽 腔 两 
个 定 标 因子 ， 中 间 区 域 则 是 在 这 两 个 定 标 
因子 之 间 进 行 插值 。 研 究 表 明 ， 即 使 婴儿 
和 儿童 的 咽 腔 长 度 不 到 成 年 体 长 度 的 一 半 ， 
他 们 也 能 在 喉头 下 降 之 前 就 开始 形成 元 音 
对 立 。Badin 的 研究 证 明 嘴唇 的 动作 可 以 
补偿 喉头 下 降 的 作用 ， 即 使 在 高 喉 的 情况 
下 ， 也 能 产生 正常 的 F1-F2 空间 ([45]Badin 
et al,2014). Boé 等 认为 无 论 咽 腔 多 长 ， 从 
出 生 到 成 年 ， 咽 管 的 大 小 和 形状 都 是 相当 
稳定 的 ([46]Bos et al,2013). fH Boer 认为 这 
些 模型 过 于 简化 ([32]Boer，2010)。 从 声 道 
模型 的 研究 可 以 看 出 ， 不 断 改进 声 道 模型 
可 以 推进 声 道 演 化 的 模拟 研究 。 


6. 元 音 涌 现时 间 的 推论 


元 音 的 涌现 主要 包括 两 个 方面 : 一 是 
元 音 涌 现 的 方式 和 过 程 ; 二 是 元 音 涌现 的 
时 间 。 目 前 对 于 元 音 涌现 的 条 件 和 过 程 ， 
主要 是 利用 古人 类 的 化 石 信息 构建 发 音 生 
理 形态 和 模型 来 讨论 元 音 的 涌现 。 男 一 个 
方面 是 通过 研究 人 类 和 非 人 类 灵 长 类 的 发 
音 来 讨论 元 音 的 涌现 。 这 些 研究 本 文 在 前 


面 几 节 已 经 做 了 充分 的 综述 。 在 元 音 涌现 
的 时 间 上 ， 可 以 分 为 一 下 几 种 观点 : 1) 
Lieberman, Laitman, Crelin 等 学 者 进行 了 
大 量 的 化 石 研究 ， 认 为 尼 安 德 特 人 不 具有 
现代 人 类 的 发 音 能 力 ， 从 发 音 形态 上 只 具 
有 较 低 的 言语 能 力 。 也 有 学 者 认为 现代 人 
了 和 尼 安 德 特 人 不 属于 同一 文 ， 因 此 ， 不 
可 以 类 比 。Lieberman 等 学 者 认为 言语 大 
约 在 直立 人 后 期 出 现 (0.1 mya) 
€ [1]Lieberman,1984; [2]Lieberman et 
al,2015; [15]Laitman et al,1978; [47] 
Laitman,1985; [48] Crelin, 1989) 。2)Budil 
根据 Laitman 等 对 古人 类 头颅 基 的 化 石 的 
测量 数据 ， 发 展 了 一 种 OK 系数 。 并 在 此 基 


础 上 进行 了 古人 类 发 音 形 态 的 重 构 研 究 ， 
E 测 古人 类 的 发 音 应 该 形成 于 上 更 新 世 
(the Upper Pleistocene, 0.126-0.0117 mya) 
([18]Budil, 1994) . 3) Arensburg 对 出 土 
的 一 个 完整 的 舌 骨 化 石 进行 了 研究 ， 认 为 
尼 安 德 特 人 的 舌 骨 和 发 音 形 态 与 智 人 已 经 
没有 差别 。 他 推测 言语 涌现 的 时 间 在 旧 石 
器 时 期 中 期 (Middle Palaeolithic， 大 约 0.2 
to 0.045 mya) 。 发 音 器 官 的 演化 应 该 更 早 ， 
在 旧 石 器 中 期 之 前 已 经 开始 演化 和 形成 
([49]Arensburg et al, 1989) 。4) Beo 等 学 者 
对 当前 言语 演化 和 起 源 的 研究 进行 了 梳理 ， 
认为 现 有 的 证 据 压 倒 性 地 驶 斥 了 长 期 存在 
的 喉 部 下 降 理 论 ， 将 “语言 的 起 源 ” 从 大 约 
0.2 mya 推 到 大 约 20 mya ([6]Boé et al, 
2019) 。 


7. 结语 


从 以 上 的 研究 可 以 看 出 ， 无 论 是 喉头 
下 降 理论 还 是 对 这 种 理论 的 质疑 和 新 的 证 
据 ， 关 键 问题 主要 集中 : 1) 喉头 下 降 是 
否 就 一 定 能 产生 语言 所 需 的 三 个 基本 元 音 ; 
2) 喉头 不 下 降 是 否 也 能 产生 三 个 语言 的 
基本 元 音 ; 3) 元 音 共振 峰 的 对 立 模式 怎 
样 来 判定 ; 4〉 元 音 涌现 时 间 的 推论 。 因 
此 ， 喉 头 下 降 理论 和 新 的 研究 对 这 一 理论 
的 质疑 和 争论 构成 了 现在 人 类 言语 声 道 演 
化 研究 的 现状 。 
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